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Die folgenden Angaben tind den vom AnmeJder oingereichten Untoriagm •ntnomnwn 

Prufungsantrag gem. § 44 PatG ist gestellt 

® Verfahren und Einrichtung zum Durchfuhren von Cache-Segment-Flu9h- und 
Cache-Segment-lnvalidier-Operationen 

@ Das Verfahren bzw. die Einrichtung zum Durchfuhren 
von Cache-Segment-Flush- und Cache-Segment-lnvali- 
dier-Operationen verwendet spezielle Befehle, wobei 
durch Ausfuhren eines einzelnen dieser Befehle durch ei- 
nen Prozessor Daten in einem Segment eines Cache-Spei- 
chers invalidisiert bzw. einer Flush-Operation unterzogen 
warden. Der einzelne Befehl (160) weist einen Befehlsco- 
de (210) und einen ein Register spezifizierenden Abschnitt 
(212) auf. Das von dem Befehl spezifizierte Register ent- 
halt Daten, aus denen eine Startadresse eines Segments 
des Cache-Speichers (300) bestimmt wird. Die in dem Ca- 
che-Segment enthaltenen Daten werden anschlieSend in- 
validiert oder einer Flush-Operation unterzogen, d. h. aus 
dem Cache-Speicher in einen auSerhelb des Cache-Spei- 
■ chers liegenden Speicherbereich kopiert bzw. geschrie- 
ben. 
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Beschreibung 



Die Erfindung bezieht sich auf Verfahren und Einrichtun- 
gen eines Computersystems, welche das Invalidieren und/ 
oder die Rush-Operation eines Abschnitts eines Cache- 5 
Speichers erleichtern. 

Die Verwendung eines Cache-Speicbers in einem Com- 
putersystem ermbglicht die Verringerung der Speicherzu- 
griffszeit. Die grundsatzliche Idee der Cache-Organisation 
besteht darin, daB durch Haiten der am haufigsten zugegrif- 10 
fenen Befehle und Daten in dem schnellen Cache-Speicher 
die durchschnitdiche SpeicherzugrifTszeit sich der Zugriffs- 
zeit des Cache-Speichers annahert Um einen optimalen 
KompromiB zwischen der Cache-GroBe und Leistung zu er- 
reichen, implementieren typische Computersysteme eine 15 
Cache-Hierarchie; d. h. verschiedene Ebenen von Cache- 
Speichem, Die verschiedenen Ebenen von Cache-Speichern 
korrespondieren mit unterschiedlichen Abstanden von dem 
Kern des Prozessors. Je naher der Cache dem Prozessor ist, 
desto schneUer ist der Datenzugriff. Je naher der Cache dem 20 
Prozessor ist, desto kostenaufwendiger ist er jedoch zu im- 
plementieren. Im Ergebnis ist der Cache umso schneUer und 
kleiner, je naher die Cache-Ebene ist. 

Eine Cache-Einheit ist ublicherweise zwischen dem Pro- 
zessor und dem Hauptspeicher angeordnet; sie umfafit Ubli- 25 
cherweise eine Cache-Steuereinrichtung (Cache-Controller) 
und einen Cache-Speicher, wie beispielsweise einen suti- 
schen Speicher mit wahlfreiem Zugriff (SRAM). Die Ca- 
che-Einheit kann auf dem gleichen Chip wie der Prozessor 
enthalten oder als separate Komponente vorhanden sein. Al- 30 
temativ kann die Cache-Steuereinrichtung auf dem Chip des 
Prozessors enthalten und der Cache-Speicher durch exteme 
SRAM -Chips ausgebildet sein. 

Die Leistung des Cache-Speichers wird haufig anhand 
seines TrefFerverhaltnisses gemessen. Wenn der Prozessor 35 
auf den Speicher Bezug nimmt und Daten in seinem Cache 
vorfindet, wird dies als Treffer bezeichnet Wenn die Daten 
nicht in dem Cache gefunden werden, so sind sie in dem 
Hauptspeicher, was als Fehiversuch gezahlt wird. Wenn ein 
Fehlversuch auftritt, dann wird eine Zuweisung eines Ein- 40 
trags getroffen, der von der Adresse des Zugriffs indexiert 
wird Bei dem Zugriff kann es sich um ein baden von Daten 
in den Prozessor oder ein Speichern von Daten aus dem Pro- 
zessor in den Speicher handeln. Die cache-gespeicherten In- 
formationen werden von dem Cache-Speicher gehaiten, bis 45 
sie nicht mehr benotigt werden, unguldg werden oder durch 
andere Daten ersetzt werden, in welchen Fallen die Zuwei- 
sung des Cache- Eintrags aufgehoben wird. 

Wenn andere Prozessoren oder Systemkomponenten Zu- 
griff auf den Hauptspeicher haben, wie das beispielsweise 50 
bei einem DMA-Controller der Fall ist, und der Hauptspei- 
cher iiberschrieben werden kann, muB die Cache-Steuerein- 
richtung den betroffenen Cache dariiber informieren, dafi 
die Daten in dem Cache ungultig sind, sofem sich die Daten 
in dem Hauptspeicher geandert haben. Eine solche Opera- 55 
don ist als Cache-Invalidieren bekannt Wenn die Cache- 
Steuereinrichtung eine RUckschreib-Strategie implementiert 
und bei einem Cache-Treffer die Daten nur aus dem Prozes- 
sor in den Cache schreibt, miissen die Cache-Inhalte unter 
speziellen Bedingungen zu dem Hauptspeicher ubertragen 60 
werden. Dies ist beispielsweise der Fall, wenn das DMA- 
Chip Daten aus dem Hauptspeicher zu einer Peripherieein- 
heit ubertragt, aber die aktuellen Werte nur in einem SRAM- 
Cache gespeichert sind. Diese Art der Operation ist als Ca- 
che-Flush-Operation (Cache-Spiilen) bekannt. 65 

Gegenwartig werden derartige Invalidier- und/oder 
Flush-Operationen fiir eine zugehorige Cache-Zeile auto- 
matisch von Hardware ausgefUhrt Fiir besdmmte Situatio- 



ns wurde Software entwickelt, um den Cache-Speicher zu 
invalidieren und/oder zu spillen (flush). Gegenwartig umf as- 
sen derartige Softw are-Tec hniken die Verwendung eines 
Befehls, welcher an dem gesamten Cache-Speicher, der zu 
dem Prozessor gehort, von welchem der Befehl herriihrt, 
operiert Jedoch erfordem derartige Invalidier- und/oder 
Flush-Operationen eine grofie Zeitdauer fur ihren AbschluB 
und bieten keine Granularity oder Steuermdglichkeit fur 
den Benutzer, um spezielle Daten oder Abschnitte von Da- 
ten aus dem Cache zu invalidieren und/oder zu spillen, wah- 
rend andere Daten innerhalb des Cache-Speichers intakt 
bleiben. Wenn eine Flush-Operation nur an dem gesamten 
Cache-Speicher operiereo kann, fUhrt das zu einer Inflexibi- 
litat und mindert die Systemleistung. AuBerdem kann eine 
Datenverfalschung auftreten, wenn eine Cache-Invalidie- 
rungs-Ope ration nur an dem gesamten Cache moglich ist 
Aufgabe der Erfindung ist es, die genannten Nachteile zu 
vermeiden. 

Diese Aufgabe wird erfindungsgeraafl durch ein Compu- 
tersystem mit den Merkmalen des Patentanspruchs 1 bzw. 7, 
einen Prozessor mit den Merkmalen des Patentanspruchs 13 
bzw. 18, ein Verfahren mit den Merkmalen des Patentan- 
spruchs 24 bzw. 29 bzw. eine computer- lesbare Einrichtung 
mit den Merkmalen des Patentanspruchs 35 bzw. 36 geldst. 

Die Erfindung umfaBt ein Verfahren und eine Einrich- 
tung, die Befehle zum DurchfUhren von Cache-Speicher-In- 
validier- und Cache-Speiche^Flush-Operationen in ein 
Computersystem einbringt Bei einem AusfUhrungsbeispiel 
umfafit das Computersystem einen Cache-Speicher mit ei- 
ner Vielzahl von Cache-Zeilen, die jeweils Daten speichern, 
und einen Speicherbereich zum Speichern eines Datenope- 
randen. Eine AusfUhrungseinheit ist mit dem Speicherbe- 
reich gekoppelt und operiert in Abhangigkeit vom Empfang 
eines einzelnen Befehls an Datenelementen in dem Daten- 
operanden, um Daten in einem vorgegebenen Abschnitt der 
Mehrzahl von Cache-Zeilen zu invalidieren. 

Vorteilhafte Weiterbildungen sind in den Unteranspril- 
chen gekennzeichnet 

Im folgenden wird die Erfindung anhand von in der 
Zeichnung dargestellten AusfUhrungsbeispielen naher be- 
schrieben. 

Die Zeichnung umfaBt folgende Figuren: 

Fig. 1 veranschaulicht ein Beispielcomputersystem. 

Fig. 2 veranschaulicht ein AusfUhrungsbeispiel des For- 
mats eine Cache-Steuerbefehls 160, der bei einem AusfUh- 
rungsbeispiel der Erfindung vorgesehen ist 

Fig. 3 veranschaulicht die grundsatzliche Betriebsweise 
der Cache-Steuertechnik gemaB einem AusfUhrungsbeispiel 
der Erfindung. 

Fig. 4 A veranschaulicht ein AusfUhrungsbeispiel der Be- 
triebsweise des Cache-Segment-Invalidier-Befehls 162. 

Fig. 4B veranschaulicht ein AusfUhrungsbeispiel der Be- 
triebsweise des Cache-Segment-Flush-Befehls 164. 

Fig. 4C veranschaulicht ein AusfUhrungsbeispiel eines 
Cache-Segment-Flush- und Invalidier-Befehls 166. 

Fig. 5 A ist ein Ablaufdiagramm, das ein AusfUhrungsbei- 
spiel des Cache-Segment- In valid! er-Prozesses gemafl der 
vorliegenden Erfindung veranschaulicht 

Fig. 5B ist ein Ablaufdiagramm, das ein AusfUhrungsbei- 
spiel des Cache-Segment-Flush- Prozesses gemaB der vor- 
Uegenden Erfindung veranschaulicht 

In der folgenden Beschreibung werden zahlreiche spe- 
zielle Details angegeben, um ein besseres Verstandnis der 
Erfindung zu erreichen. Es ist jedoch klar, dafi die Erfindung 
auch ohne diesen speziellen Details ausgefUhrt werden 
dann. An anderen Stellen werden gut bekannte Schaltungen, 
Strukturen und Techniken nicht im Detail gezeigt, um die 
Erfindung nicht zu verdunkeln. 
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Fig. 1 veranschaulicht ein Computersystem, welches die 
Prinzipien der Erfindung implemenrieren kann. Das Compu- 
tersystem 100 umfaBt einen Prozessor 105, eine Speicher- 
einrichtung 110 und einen Bus 115. Der Prozessor 105 ist 
mit der Seichereinrichtung 110 Uber den Bus 115 gekoppelt s 
Die Speichereinricfatung 110 steht steilvertretend fur einen 
oder mehrere Mechanismen zum Speichern von Daten. Bei- 
spielsweise kann die Speichereinrichtung 110 einen Nur- 
Lese-Speicher(ROM), einen Speicher mit wahlfreiem Zu- 
griff (RAM), ein Magnetplattenspeichermedium, ein opti- io 
sches Speichermedium, Cache-Speicherbauelemente und/ 
oder andere maschinen-lesbare Medien umfassen. Zusatz- 
lich sind eine Reihe von Benutzer-Eingabe/Ausgabe-Ein- 
richtungen, wie beispielsweise eine Tastatur 120 und eine 
Anzeige 125, mit dem Bus 115 gekoppelt. Der Prozessor is 
105 reprasentiert eine zentrale Verarbeitungseinheit einer 
beliebigen Architektur, wie beispielsweise CISC, RISC, 
VLIW oder Hybrid-Architektur. AuBerdem kann der Pro- 
zessor 105 auf einem oder mehreren Chips implementiert 
sein. Der Bus 115 reprasentiert einen oder mehrere Busse 20 
(zum Beispiel AGP, PCI, ISA, X-Bus, VESA) und Briicken 
(auch als Bussteuereinrichtungen bezeichnet). Wahrend die- 
ses Ausfuhrungsbeispiei unter Bezugnahme auf ein Einzel- 
prozessor-Computersystem beschrieben wird, konnte die 
Erfindung auch in einem Multi-Prozessor-Computersystem 25 
implementiert werden. 

Neben anderen Einrichtungen kSnnen wahlweise ein oder 
mehrere Netzwerke 130, ein TV-Signalempflnger 131, ein 
Fax/Modem 132, eine Digitalisiereinheit 133, eine Klang- 
einheit 134 und eine Graphikeinheit 135 mit dem Bus 115 30 
gekoppelt sein. Die Netzwerkeinrichtung 130 und das Fax/ 
Modem 132 reprasentieren eine oder mehrere Netzwerkver- 
bindungen zum Obermitteln von Daten uber ein maschinen- 
lesbares Medium (z. B. Tragerwellen). Die Digitalisierein- 
heit 133 reprasentiert eine oder mehrere Einrichtungen zum 35 
Digitalisieren von Bildera (beispielsweise einen Scanner, 
eine Kamera, etc.). Die Klangeinheit 134 reprasentiert eine 
oder mehrere Einrichtungen zum Eingeben und/oder Ausge- 
ben von Klangen (z. B. Mikrophone, Lautsprecher, Magnet- 
speicher, etc.). Die Graphikeinheit 135 reprasentiert eine 40 
oder mehrere Einrichtungen zum Erzeugen von 3D-Bildem 
(z. B. Graphikkanen). Fig, 1 veranschaulicht dariiber hin- 
aus, daB die Speichereinrichtung 110 Daten i36 und Soft- 
ware 137 speichert Daten 136 reprasentieren Daten, die in 
einem oder mehreren der hier beschriebenen Formate ge- 45 
speichert sind. Software 137 reprasentiert den notwendigen 
Befehlscode zum Durchfiihren irgendwelcher und/oder 
samtlicher der unter Bezugnahme auf die Fig. 2 und 4 bis 6 
beschriebenen Techniken. Selbstverstandlich enthalt die 
Speichereinrichtung 110 vorzugsweise (nicht gezeigte) zu- 50 
satzliche Software, welche fllr das Verstandnis der Erfin- 
dung nicht erforderlich isL 

Fig. 1 veranschaulicht dariiber hinaus, dafi der Prozessor 
105 eine Dekodiereinheit 140, einen Registersatz 141, eine 
Ausfuhrungseinheit 142 und einen intemen Bus 143 zum 55 
AusfUhren von Befehlen enthalt Der Prozessor 105 enthalt 
ferner zwei interne Cache-Speicher, einen Ebene-0-(LOO 
Cache- Speicher, welcher mit der Ausfuhrungseinheit 142 
gekoppelt ist, und einen Ebene-l-(Ll-)Cache-Speicher, wel- 
cher mit dem LO-Cache gekoppelt ist. Ein externer Cache- 60 
Speicher, d. h. ein Ebene-2-(L2-)Cache-Speicher 172 ist mit 
dem Bus 115 uber eine Cache-Steuereinrichtung 170 gekop- 
pelt. Die tatsachliche Anordnung der verschiedenen Cache- 
Speicher ist eine Frage der Designauswahl oder kann durch 
die Computersystemarchitektur vorgegeben sein. So ist es 65 
klar, daB der LI -Cache auch auSerhalb des Prozessors 105 
angeordnet werden konnte. Bei alternativen Ausftthrungs- 
beispielen konnen mehr oder weniger Ebenen von Cache- 



Speichem (anstelle LI und L2) implementiert werden. In 
Fig. 1 sind drei Ebenen der Cache-Hierarchie gezeigt, aber 
es kdnnten mehr oder weniger Cache-Ebenen sein. Bei- 
spielsweise kdnnte die Erfindung auch dann ausgefuhrt wer- 
den, wenn es nur eine Cache- Ebene (nur L0) oder nur zwei 
Cache-Ebenen (LO und LI) gSbe oder wenn es vier oder 
mehr Cache-Ebenen waren. 

Selbstverstandlich enthalt der Prozessor 105 zusatzliche 
Schaltungen, welche fur das Verstandnis der Erfindung nicht 
erforderlich sind. Die Dekodiereinheit 140, Register 141 
und Ausfuhrungseinheit 142 sind miteinander uber den in- 
temen Bus 143 gekoppelL Die Dekodiereinheit 140 wird 
zum Dekodieren von durch den Prozessor 105 empfangenen 
Befehlen in Steuersignale und/oder Mikrobefehlscodeein- 
trittspunkte verwendet In Abhangigkeit von diesen Steuer- 
signalen und/oder Mikrobefehlscodeeinuittspunkten fuhrt 
die Ausfuhrungseinheit 142 die geeigneten Operationen 
durch. Die Dekodiereinheit 140 kann unter Verwendung ei- 
ner beliebigen Anzahl unterschiedlicher Mechanismen im- 
plementiert werden (z. B. einer Nachschlagetabelle, einer 
Hard wareimple men tierung, einer PLA, etc.). Wahrend die 
Dekodierung der verschiedenen Befehie hier durch eine Se- 
rie von Wenn/dann-Aussagen reprasendert wird, ist es klar, 
daB die Ausftihrung eines Befehls keine serielle Verarbei- 
tung dieser Wenn/dann-Aussagen erfordert Statt dessen 
wird jeder Mechanismus zum logischen Durchfuhren dieser 
We nn/dann- Verarbei tun g als innerhalb des Umfangs der Im- 
plementierung der Erfindung liegend angesehen. 

Die gezeigte Dekodiereinheit 140 umfaBt eine Heranhol- 
einheit 150, welche Befehie heranholt, und einen Befehls- 
satz 155 zum Durchfiihren von Operationen an Daten. Der 
Befehlssatz 155 umfafit erfindungsgemaSe Cache- Steuerbe- 
fehle 166. Die Cache-Steuerbefehle 160 umfassen: einen 
Cache-Segment-Invalidier-Befehl, einen Cache-Segment- 
Flush-Befehl und einen Cache-Segment-Flush-und-Invali- 
dier-BefehL Ein Beispiel des Cache-Segment- In validier- Be- 
fehls ist ein Seiten-mvaUdler(PGINVD)-Befehl, der an ei- 
ner vom Benutzer spezifizierten linearen Adresse operiert 
und die der-linearen Adresse entsprechende physikalische 
4KByte-Seite aus samtlichen Ebenen der Cache-Hierarchie 
fiir samtliche Teilnehraer in dem Computersystem, die mit 
dem Prozessor verbunden sind, invalidiert Ein Beispiel des 
Cache-Segment-Flush-Befehls ist ein Seiten- 
Flush(FGFLUSH>Befehl, der Daten in der der linearen 
Adresse entsprechenden physikalischen 4KByte-Seite einer 
Flush-Operation unterzieht. Ein Beispiel des Cache-Seg- 
ment-Flush-und-Invalidier-Befehls ist ein Seiten-Flush/In- 
validier(PGFLUSHINV)-Befehl, der zunachst die Daten in 
der der lineraren Adresse entsprechenden physikalischen 
4KByte-Seite einer Flush-Operation unterzieht und dann die 
der lineraren Sresse entsprechende physikalische 4KByte- 
Seite invalidiert. Bei alternatives AusfUhrungsbeispielen 
konnen die Cache-Steuerbefehle entweder an von einem Be- 
nutzer spezifizierten linearen oder physikalischen Adressen 
operieren und die zugehorigen Invalidier- und/oder Flush- 
Operationen gem&B den Prinzipien der Erfindung durchfiih- 
ren. 

Zusatzlich zu den Cache-Segment-Invalidier-Befehlen, 
den Cache-Segment-Flush-Befehlen und den Cache-Seg- 
ment-Flush- und-Invalidier-Befehlen kann der Prozessor 
neue Befehie und/oder Befehie, die denen in vorhandenen 
Mehrzweckprozessoren zu findenden ahnlich sind, enthal- 
ten. Beispielsweise unterstUtzt der Prozessor 105 einen Be- 
fehlssatz, welcher mit dem Intel-Architektur-Befehlssatz 
kompatibel ist, der von vorhandenen Prozessoren verwendet 
wird, wie beispielsweise dem Pentium*-Prozessor. 

Die Register 141 reprasentieren einen Speicherbereich 
des Prozessors 105 zum Speichern von Informationen, wie 
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beispielsweisc Stcucr/Status- Informationen, skalaren und/ 
oder gepackten Ganzzahldaten, Gieitkommadaten, etc. Es 
ist klar, daB ein Aspekt der Erfindung der beschriebene Be- 
fehissatz ist GemaB diesem Aspekt der Erfindung ist der 
zum Speichern der Daten verwendete Speicberbereich un- 
kritisch. Der Begriff Datenverarbeitungssystem wird hier 
fur irgendeine Einrichtung zum Verarbeiten von Daten ver- 
wendet, einschliefilich dem unter Bezugnahme auf Fig. 1 
beschriebenen Prozessor umfaBt 

Fig. 2 veranschaulicht das Format des Cache-Segment- 
In vali die r- Be feh Is, des Cache-Segment- Flush-Befehls und 
des Cache-Segment-Flush-und-Invalidier-Befehis gemaB 
der Erfindung. Diese Befehle werden hier als Cache-Steuer- 
Befehle 160 bezeichnet. Die Cache- Steuerbefehle 160 urn- 
fassen einen Befehlscode (OP CODE) 210, welcher die 
Operation des Cache-Steuerbefehls 160 angibt, und einen 
Operanden 212, welcher den Namen eines Registers oder ei- 
nes Speicherplatzes spezifiziert welches bzw, welcher eine 
Startadresse des Datenobjekts halt, an welchem der Befehl 
160 operieren wird. 

Fig. 3 veranschaulicht die grundsatzliche Betriebsweise 
des Cache-Steuerbefehls 160. Bei der Ausflihrung der Erfin- 
dung stellt der Cache-Steuerbefehl 160 den Register-(oder 
Speicher-)Ort zur Verfugung, welcher eine Startadresse des 
Datenobjekts enthalt an dem der Befehl 160 operieren wird. 
Bei einem AusfQhrungsbeispiel umfaBt die Startadresse X 
am hochsten bewertete Bits, welche in dem Register-Coder 
Speicher-)Ort gespeichert sind, und Y am geringsten bewer- 
tete Bits. Der dem Cache-Steuerbefehl 160 zugeordnete Ca- 
che-SteuerprozeB verschiebt dann die X Bits nach rechts um 
Y Bit-Positionen, um die vollstandige Startadresse zu erlan- 
gen. Dann arbeitet der Cache-Steuerbefehl 160 an den der 
Startadresse entsprechenden Daten in dem Cache-Speicher 
sowie an Daten, die Z nachfolgenden Adressen entsprechen. 
Bei einem Ausfuhrungsbeispiel arbeitet der Cache-Steuer- 
befehl 160 an einer Seite von Daten, die im Cache-Speicher 
gespeichert ist, von welcher die Anfangsadresse in einem 
Register-(oder Speicher-)Ort gespeichert ist, der in dem 
Operanden 212 des Steuerbefehls spezifiziert ist Bei alter- 
nativen Ausfuhrungsbeispielen kann der Cache-Steurbefehl 
160 an einer beliebigen vorgegebenen, in dem Cache ge- 
speicherten Datenmenge operieren, von welcher die An- 
fangsadresse in einem Register oder einem Speicherplatz 
gespeichert ist das bzw. der von dem Operanden 212 in dem 
Cache-Steuerbefehl spezifiziert ist 

In Fig. I sind nur die L0-, LI- und L2-Ebenen gezeigt 
aber es ist klar, daB mehr oder weniger Ebenen einfach im- 
plemendert werden konnen. Das in den Fig. 4 bis 6 gezeigte 
Ausfuhrungsbeispiel beschreibt die Benutzung der Erfin- 
dung in bezug auf eine Cache-Ebene. 

Details der verschiedenen AusfUhrungsbeispiele der Ca- 
che-Steuerbefehle 160 werden jetzt beschrieben. Zuerst 
wird der Cache-Segment-Invalidier-Befehl 162 beschrie- 
ben. Fig* 4A veranschaulicht ein Ausfuhrungsbeispiel des 
Befehls. Bei Empfang des Cache-Segment-Invaiidier-Be- 
fehls 162 bestirnmt der Prozessor 105 aus dem Operanden 
212 des Befehls 162 den Registerort, in welchem die am 
hochsten bewerteten Bits der Startadresse des Datenobjekts 
gespeichert sind. Dann verschiebt der Prozessor 105 den 
Wert in dem Operanden 212 um die Anzahl der am gering- 
sten bewerteten Bits der Startadresse. Sobald die vollstan- 
dige Startadresse gewonnen ist setzt der Prozessor 105 die 
Invalidier-Bits des Cache-Speichers 300 der betroffenen 
Speicherpla'tze. Bei einem Ausfuhrungsbeispiel wird eine 
Seite des Cache-Speichers 320 invalidiert welche eine 
Startadresse aufweist die der durch den Operanden 212 spe- 
zifizierten entspricht Bei altemativen Ausfuhrungsbeispie- 
len werden unter Verwendung der vorliegenden Technik ir- 



gendwelche vorgegebenen Abschnitte des Cache-Speichers 
320 invalidiert die eine Startadresse aufweisen, die derjeni- 
gen entspricht die durch den Operanden 312 spezifiziert ist. 
Fig. 4B zeigt ein Ausfuhrungsbeispiel des Cache-Seg- 

5 ment-Flush-Befehls 164. Bei Empfang des Cache-Segment* 
Flush-Befefals 164 bestirnmt der Prozessor 105 aus dem 
Operanden 312 des Befehls 164 den Registerort in welchem 
die am hochsten bewerteten Bits der Startadresse des Daten- 
objekts gespeichert sind. Dann verschiebt der Prozessor 105 

10 den Wert durch die Anzahl der am geringsten bewerteten 
Bits der Startadresse. Sobald die vollstandige Startadresse 
gewonnen ist unterzieht der Prozessor diejenigen Speicher- 
platze des Cache-Speichers 320 der Flush-Operation, die 
durch die Ausfuhrung des Befehls 164 betroffen sind. Bei 

15 einem Ausfuhrungsbeispiel wird eine Seite des Cache-Spei- 
chers 320 der Flush-Operation unterzogen, die eine Start- 
adresse aufweist die derjenigen durch den Operanden 212 
spezifizierten entspricht Bei altemativen AusfUhrungsbei- 
spieien werden Daten in irgendwelchen vorgegebenen Ab- 

20 schnitten des Cache-Speichers 320 der Flush-Operation un- 
terzogen, die eine durch den Operanden 212 spezifizierte 
Startadresse aufweisen. 

Fig. 4C veranschaulicht ein Ausfuhrungsbeispiel des Ca- 
che-Segment-Flush-und-Invalidier-Befehls 166. Bei Emp- 

25 fang des Cache-Segment-Flush-und-Invalidier-Befehls 166 
bestirnmt der Prozessor 105 aus dem Operanden 212 des Be- 
fehls 166 den Registerort, an welchem die am hochsten be- 
werteten Bits der Startadresse des Datenobjekts gespeichert 
sind. Dann verschiebt der Prozessor 105 den Wert in dem 

30 durch den Operanden 212 spezifizierten Register um die 
Anzahl der am geringsten bewerteten Bits der Startadresse. 
Sobald die vollstandige Startadresse gewonnen ist, unter- 
zieht der Prozessor diejenigen Speicherorte des Cache-Spei- 
chers 320 einer Flush-Operation, die durch die Ausfuhrung 

35 des Befehls 166 betroffen sind. Bei einem Ausfuhrungsbei- 
spiel wird eine Seite des Cache-Speichers 320 der Flush- 
Operation unterzogen. Bei einem altemativen Ausfuhrungs- 
beispiel werden irgendwelche vorgegebenen Abschnitte des 
Cache-Speichers 320 der Flush-Operation unterzogen, die 

40 eine durch den Operanden 212 spezifizierte Startadresse 
aufweisen. Als nachstes invalidiert der Prozessor 105 die 
betrofFenen Bereiche des Cache-Speichers 320, die der 
Flush-Operation unterzogen wurden. Bei einem Ausfuh- 
rungsbeispiel wird dies durch Setzen der Invalidier-Bits je- 

45 der betroffenen Cache- Zeile durchgefUhrt 

Fig. 5 A ist ein Ablaufdiagramm, das ein Ausfuhrungsbei- 
spiel des Cache-Segment- Invaiidier-Prozesses gemaB der 
Erfindung veranschaulicht. Beginnend beim Start-Zustand 
fahrt der ProzeB 500 zum Verarbeitungsblock 510 fort, wo 

50 er den Operanden 212 des von dem Prozessor 105 empfan- 
genen Befehls 162 uberpriift, um den Speicherort des Werts 
zu bestimmen, der die am hochsten bewerteten Bits der 
Startadresse der zugehorigen Operation darstellL Der Pro- 
zeB 500 fahrt dann zum Verarbeitungsblock 512 fort wo er 

ss den die am hochsten bewerteten Bits der Startadresse repra- 
sentierenden Wert aus dem spezifizierten Speicherort ge- 
winnt Der ProzeB 500 schreitet dann zum Verarbeitungs- 
block 514 fort, wo er den gewonnenen Wert um eine vorge- 
gebene Anzahl von Bits verschiebt Bei einem AusfUh- 

60 rungsbeispiel reprasentiert die vorgegebene Anzahl die An- 
zahl der am geringsten bewerteten Bits in der Startadresse. 
Als nachstes bestirnmt der ProzeB 500 das Cache-Segment 
das durch die Operation bzw. den Befehl 162 betroffen ist 
wie es im Verarbeitungsblock 516 gezeigt ist Bei einem 

65 Ausfuhrungsbeispiel ist das Cache-Segment eine Seite. Bei 
einem Ausfuhrungsbeispiel enthalt eine Seite 4 KBytes. Bei 
altemativen Ausfuhrungsbeispielen kann das Cache-Seg- 
ment ein beliebiger vorgegebener Abschnitt des Cache- 
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Speichers sein. Der ProzeB 500 fMhrt dann zum Verarbei- 
tungsblock 518 fort, wo er die Dateo in dcm zugehbrigen 
Cache-Segment beginnend an der spezifizierten Startadresse 
invalidiert Bei einem Ausfiihrungsbeispiel wird dies ausge- 
fUhrt, indem die jeder Cache-Zeile in dem Cache-Segment 5 
entsprechenden Ungtlltig-Bits oder Invalidier-Bits gesetzt 
werden. Dann endet der ProzeB 500. 

Fig. 5B ist ein Ablaufdiagramm, das ein AusfUhrungsbei- 
spiel des erfindungsgemaBen Cache-Segment- Flush-Prozes- 
ses veranschaulicht. Beginnend im Stazt-Zustand fUhrt der io 
ProzeB 520 zum Verarbeitungsblcck 522 fort, wo er den 
Operanden 212 des von dem Prozessor 105 empfangenen 
Befehls 164 oder 166 QberprUft, urn den Speicherort desjeni- 
gen Werts zu bestimmen, der die am hochsten bewerteten 
Bits der Startadresse der zugehttrigen Operation reprasen- 15 
tiert Der ProzeB 520 fahrt dann zum Verarbeitungsblock 
524 fort, wo er den die am hochsten bewerteten Bits der 
Startadresse reprasentierenden Wert aus dem spezifizierten 
Speicherort gewinnt Der ProzeB 520 schreitet dann zum 
Verarbeitungsblock 526 weiter, wo er den gewonnenen Wert 20 
um eine vorgegebene AnzahL von Bits verschiebt Bei einem 
Ausfiihrungsbeispiel reprasentiert die vorgegebene Anzahl 
die Anzahl der am geringsten bewerteten Bits in der Start- 
adresse. Als nachstes bestimmt der ProzeB 520 das von der 
Operation bzw. den Befehlen 164 oder 166 betroffene Ca- 25 
che-Segment wie es im Verarbeitungsblock 528 gezeigt ist. 
Bei einem Ausfiihrungsbeispiel ist das Cache-Segment eine 
Seite. Bei aiternativen AusfUhrungsbeispielen kann das Ca- 
che-Segment ein beliebiger vorgegebener Abschnitt des Ca- 
che-Speichers sein. Der ProzeB 520 fahrt dann zum Verar- 30 
beitungsblock 530 fort, wo er den Inhalt des spezifizierten 
Cache-Segments in die Speichereinrichtung 110 spiilt 
(flush). Der ProzeB 520 fahrt dann zum Bntscheidungsblock 
532 fort, wo er abfragt, ob der empfangene Befehl ein Flush- 
Befehl oder ein Rush-und-Invalidier-Befehl ist. Sofern der 35 
Befehl ein Flush-Befehl ist, endet der ProzeB 520, Sofem 
der Befehl ein Rush-und-Invalidier-Befehl ist, fahrt der Pro- 
zeB 520 mit dem Verarbeitungsblock 534 fort, wo er die Da- 
ten in dem zugehdrigen Cache-Segment beginnend an der 
spezifizierten Startadresse invalidiert Bei einem AusfUh- 40 
rungsbeispiel wird dies durchgefiihrt, indem die jeder Ca- 
che-Zeile im Cache-Segment entsprechenden UngOltig-Bits 
bzw. Invalidier-Bits gesetzt werden. Dann endet der ProzeB 
520. 

Die Verwendung der vorliegenden Erfindung verbessert 45 
somit die Systemleistung, indem ein In validier- Befehl und/ 
oder ein Rush-Befehl zum Invalidieren und/oder SpUlen 
von Daten in einem beliebigen vorgegebenen Abschnitt des 
Cache-Speichers zur Verfilgung gestellt wird. In Fallen, wo 
die Konsistenz zwischen dem Cache-Speicher und dem so 
Hauptspeicher durch Software aufrechterhalten wird, wird 
die Systemleistung verbessert, da eine Rush-Operation nur 
der betroffenen Abschnitte des Cache-Speichers effektiver 
und flexibler ist als das SpUlen des gesamten Cache-Spei- 
chers. AuBerdem wird die Systemleistung verbessert, indem ss 
Rush- und/oder Invalidier-Operauonen zur Verfilgung ge- 
stellt werden, die eine grdBere Granularitat als eine Cache- 
ZeilengroBe haben, da der Benutzer unter Verwendung eines 
einzigen Befehls einen Speicherbereich einer Rush- und/ 
oder Invalidier-Operation unterziehen kann, ohne dafi er den 60 
Befehlscode andem muB, wenn das Computersystem die 
GroBe einer Cache- Zeile andert 



Patentansprilche 

1. Computersystem, aufweisend: 

einen Cache-Speicher mit einer Mehrzahl von Daten 

speichernden Cache-Zeilen; 



65 



einen Speicherbereich zum Speichem eines Datenope- 
randen; und 

einer mit dem Speicherbereich gekoppelten Ausfuh- 
rungseinheit die in Abhangigkeit vom Empfang eines 
einzelnen Befehls an Datenelementen in dem Daten- 
operanden operiert und Daten in einem vorgegebenen 
Abschnitt der Mehrzahl von Cache-Zeilen invalidiert 

2. Computersystem nach Anspruch 1, dadurch ge- 
kennzeichnet daB der Datenoperand ein Registerort ist 

3. Computersystem nach Anspruch 2, dadurch ge- 
kennzeichnet, dafi der Registerort einen Abschnitt ei- 
ner Startadresse der Cache-Zeile enthalt in welcher 
Daten invalidiert werden sollen. 

4. Computersystem nach Anspruch 3, dadurch ge- 
kennzeichnet daB der Abschnitt der Startadresse men- 
re re am hochsten bewertete Bits der Startadresse ent- 
halt 

5. Computersystem nach Anspruch 4, dadurch ge- 
kennzeichnet daB die Ausfuhrungseinheit die Daten- 
elemente um eine vorgegebene Anzahl von Bitpositio- 
nen verschiebt, um die Startadresse der Cache-Zeile zu 
gewinnen, in welcher Daten invalidiert werden sollen. 

6. Computersystem nach einem der Anspriiche 1 bis 5, 
dadurch gekennzeichnet, daB der vorgegebene Ab- 
schnitt der Mehrzahl von Cache-Zeilen eine Seite in 
dem Cache-Speicher ist 

7. Computersystem, aufweisend: 

einen ersten Speicherbereich zum Speichern von Da- 
ten; 

einen Cache-Speicher mit einer Mehrzahl von Daten 
speichemden Cache-Zeilen; 

einen zweiten Speicherbereich zum Speichern eines 
Datenoperanden, und 

eine mit dem ersten Speicherbereich, dem zweiten 
Speicherbereich und dem Cache-Speicher gekoppelte 
Ausfuhrungseinheit die in Abhangigkeit vom Emp- 
fang eines einzelnen Befehls an Datenelementen in 
dem Datenoperanden operiert, um Daten von einem 
vorgegebenen Abschnitt der Mehrzahl von Cache-Zei- 
len in dem Cache-Speicher in den ersten Speicherbe- 
reich zu kopieren. 

8. Computersystem nach Anspruch 7, dadurch ge- 
kennzeichnet dafi der Datenoperand ein Registerort ist 

9. Computersystem nach Anspruch 8, dadurch ge- 
kennzeichnet daB der Registerort eine Mehrzahl von 
am hochsten bewerteten Bits einer Startadresse derjeni- 
gen Cache-Zeile enthalt aus welcher die Daten kopiert 
werden sollen. 

10. Computersystem nach Anspruch 9, dadurch ge- 
kennzeichnet dafi die Ausfuhrungseinheit die Daten- 
elemente um eine vorgegebene Anzahl von Bitpositio- 
nen verschiebt, um die Startadresse der Cache-Zeile zu 
gewinnen, aus welcher die Daten kopiert werden sol- 
len. 

11. Computersystem nach einem der Anspriiche 7 bis 

10, dadurch gekennzeichnet dafi der vorgegebene Ab- 
schnitt der Mehrzahl von Cache-Zeilen eine Seite in 
dem Cache-Speicher ist 

12. Computersystem nach einem der Anspriiche 7 bis 

11, dadurch gekennzeichnet dafi die Ausfuhrungsein- 
heit darilber hinaus in Erwiderung des Empfangs eines 
einzigen Befehls Daten in dem vorgegebenen Ab- 
schnitt der Mehrzahl von Cache-Zeilen nach dem Ko- 
pieren der Daten in den ersten Speicherbereich invali- 
diert 

13. Prozessor, aufweisend: 

einen Dekodierer zum Dekodieren von Befehlen, und 
eine mit dem Dekodierer gekoppelte Schaltung, die in 
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Erwiderung eines einzelnen dekodierten Befehls: 
eine Startadresse eines vorgegebenen Bereichs eines 
Cache- Speichers gewinnt an weicbem der Befehl 
durchgefiihrt werden wird; 

Daten in dem vorgegebenen Bereich des Cache-Spei- 5 
chers invalidiert 

14. Prozessor nach Ansprucb 13, dadurch gekenn- 
zeichnet daB ein Abschnitt der Startadresse in einem in 
dem dekodierten Befehl spezifizierten Register ange- 
ordnet ist. io 

15. Prozessor nach Anspruch 14, dadurch gekenn- 
zeichnet daB der Abschnitt der Startadresse eine Mehr- 
zahl der am hochsten bewerteten Bits der Startadresse 
umfafit 

16. Prozessor nach Anspruch 15, dadurch gekenn- 15 
zeichnet daB die Schaltung die Datenelemente um eine 
vorgegebene Anzahl von Bit-Positionen verschiebt, um 
die Startadresse des Cache-Bereichs zu gewinnen, in 
welchem die Daten invalidiert werden sollen. 

17. Prozessor nach einem der Anspriiche Obis 16, da- 20 
durch gekennzeichnet daB der vorgegebene Bereich 
des Cache-Speichers eine Seite in dem Cache-Speicher 
ist, 

18. Prozessor, aufweisend: 

einen Dekodierer zum Dekodieren von Befehlen, und 25 
eine mit dem Dekodierer gekoppelte Schaltung, die in 
Erwiderung eines einzelnen dekodierten Befehls: 
eine Startadresse eines vorgegebenen Bereichs eines 
Cache-Speichers gewinnt, an welchem der Befehl 
durchgefiihrt wird; 30 
Daten aus dem vorgegebenen Bereich des Cache-Spei- 
chers kopiert; und 

die kopierten Daten in einem von dem Cache-Speicher 
getrennten Speicherbereich speichert 

19. Prozessor nach Anspruch 18, dadurch gekenn- 35 
zeichnet daB ein Abschnitt der Startadresse in einem in 
dem dekodierten Befehl spezifizierten Register ange- 
ordnet ist. 

20. Prozessor nach Anspruch 19, dadurch gekenn- 
zeichnet, daB der Abschnitt der Startadresse eine Mehr- 40 
zahl von am hochsten bewerteten Bits der Startadresse 
umfafiL 

21. Prozessor nach Anspruch 20, dadurch gekenn- 
zeichnet, daB die Schaltung die Datenelemente um eine 
vorgegebene Anzahl von Bitpositionen verschiebt, um 45 
die Startadresse des Cache-Bereichs zu gewinnen, aus 
welchem die Daten kopiert werden sollen. 

22. Prozessor nach einem der Anspriiche 1 8 bis 2 1 , da- 
durch gekennzeichnet, daB der vorgegebene Bereich 
des Cache-Speichers eine Seite in dem Cache-Speicher 50 
ist 

23. Prozessor nach einem der AnsprUche 18 bis 22, da- 
durch gekennzeichnet, daB die Schaltung ferner die 
Daten in dem vorgegebenen Bereich des Cache-Spei- 
chers in Erwiderung des Empfangs des einzelnen Be- 55 
fehls nach Kopieren der Daten in dem Speicherbereich 
invalidiert 

24. Computer-implementiertes Verfahren, wobei: 

a) ein einzelner Befehl dekodiert wird; 

b) in Erwiderung des Dekodierens des einzelnen 60 
Befehls eine Startadresse eines vorgegebenen Be- 
reichs eines Cache-Speichers gewonnen wird, an 
welchem Bereich der einzelne Befehl durchge- 
fiihrt wird; und 

c) die Ausftihrung des einzelnen Befehls abge- 65 
sen lessen wird, indem Daten in dem vorgegebe- 
nen Bereich des Cache-Speichers invalidiert wer- 
den. 



25. Verfahren nach Anspruch 24, dadurch gekenn- 
zeichnet, daB beim Invalidieren Ungilldg-Bits in dem 
vorgegebenen Bereich des Cache-Speichers gesetzt 
werden. 

26. Verfahren nach Anspruch 24 oder 25, dadurch ge- 
kennzeichnet daB zum Gewinnen der Startadresse: 

b.l) ein Abschnitt der Startadresse aus einem in 
dem dekodierten Befehl spezifizierten Speicher- 
platz gewonnen wird; 

b.2) der Abschnitt der Startadresse um eine vorge- 
gebene Anzahl von Posidonen verschoben wird. 

27. Verfahren nach Anspruch 26, dadurch gekenn- 
zeichnet daB im Schritt b.l) der Abschnitt der Start- 
adresse eine Mehrzahl von am hochsten bewerteten 
Bits der Startadresse enthalt und daB im Schritt b.2) 
die vorgegebene Anzahl von Bitpositionen die Anzahl 
der am geringsten bewerteten Bits der Startadresse dar- 
stellt. 

28. Verfahren nach einem der Anspriiche 24 bis 27, 
dadurch gekennzeichnet daB der vorgegebene Bereich 
des Cache-Speichers eine Seite in dem Cache-Speicher 
ist 

29. Computer-implementiertes Verfahren, wobei: 

a) ein einzelner Befehl dekodiert wird; 

b) in Erwiderung des Dekodierens des einzelnen 
Befehls eine Startadresse eines vorgegebenen Be- 
reichs eines Cache-Speichers gewonnen wird, an . 
welchem Bereich der einzelne Befehl durchge- 
fuhrt wird; und 

c) die Ausflihrung des einzelnen Befehls abge- 
schlossen wird, indem Daten aus dem vorgegebe- 
nen Bereich des Cache-Speichers kopiert und die 
kopierten Daten in einem von dem Cache-Spei- 
cher getrennten Speicherbereich gespeichert wer- 
den. 

30. Verfahren nach Anspruch 29, dadurch gekenn- 
zeichnet daB im Schritt b): 

b.l) ein Abschnitt der Startadresse aus einem in 
dem dekodierten Befehl spezifizierten Speicher- 
platz gewonnen wird; 

b.2) der Abschnitt der Startadresse um eine vorge- 
gebene Anzahl von Bitpositionen verschoben 
wird, um die Startadresse des Cache-Bereichs zu 
erlangen, aus welchem Daten kopiert werden sol- 
len. 

31. Verfahren nach Anspruch 30, dadurch gekenn- 
zeichnet daB im Schritt b.l) der Abschnitt der Start- 
adresse eine Mehrzahl von am hochsten bewerteten 
Bits der Startadresse enthalt, und daB im Schritt b.2) 
die vorgegebene Anzahl von Bitpositionen die Anzahl 
der am geringsten bewerteten Bits der Startadresse re- 
prasendert 

32. Verfahren nach einem der Anspriiche 29 bis 31, 
dadurch gekennzeichnet daB der vorgegebene Bereich 
des Cache-Speichers eine Seite in dem Cache-Speicher 
ist 

33. Verfahren nach einem der Anspriiche 29 bis 32, 
dadurch gekennzeichnet dafi 

d) die Daten in dem vorgegebenen Bereich des 
Cache-Speichers in Erwiderung des Empfangs 
des einzelnen Befehls nach dem Kopieren der Da- 
ten zu dem Speicherbereich invalidiert werden. 

34. Computer-lesbare Einrichtung, aufweisend: 

ein computer- lesb ares Medium, das einen Befehl spei- 
chert, welcher dann, wenn er von einem Prozessor aus- 
geftihrt wird, den Prozessor veranlaBu 
eine Startadresse eines vorgegebenen Bereichs eines 
Cache-Speichers, in welchem der Befehl durchgefuhrt 
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wird, zu gewinnen; und 

Daten in dcm vorgegebenen Bcreich des Cache-Spei- 
chers zu invalidieien. 

35. Computer-lesbare Einrichtung, aufweisend: 

ein compute lesbares Medium, das einen Befehl spei- 5 
chert, welcber dann, wenn er von einera Prozessor aus- 
gefUhrt wird, den Prozessor veranlaSt: 
eine Staitadresse eines vorgegebenen Bereichs eines 
Cache-Speichers, in welchem der Befehl durchgefiihrt 
wird, zu gewinnen; 10 
Daten aus dem vorgegebenen Bereich des Cache-Spei- 
chere zu kopieren; und 

die kopierten Daten in einexn von dem Cache-Speicher 
getrennten Speicherbereich zu speichem. 

36. Einrichtung nach Anspruch 35, dadurch gekenn- is 
zeichnet, daB der Befehl femer den Prozessor veran- 
lafit, die Daten in dem vorgegebenen Bereich des Ca- 
che-Speichers nach dem Kopieren der Daten in den 
Speicherbereich zu invalidieren. 
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